Construction et enrichissement automatique d'ontologie à partir de ressources externes

نویسندگان

  • Eric Kergosien
  • Mouna Kamel
  • Christian Sallaberry
  • Marie-Noëlle Bessagnet
  • Nathalie Aussenac-Gilles
  • Mauro Gaio
چکیده

La construction automatique d’ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d’étendre les méthodes classiques en matière de construction d’ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d’ontologie, et (2) en enrichissant l’ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD

Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles n...

متن کامل

Construction d'une ontologie à partir d'une base de données relationnelle : approche dirigée par l'analyse des formulaires HTML

RÉSUMÉ. L’émergence et la généralisation du Web dans tous les domaines, a permis à de nombreuses entreprises d’offrir une variété de services et d’informations en ligne, suscitant ainsi un réel besoin de partage et d’interopérabilité. Cela nécessite une infrastructure permettant à des agents logiciels d’exploiter, de composer et de raisonner sur les contenus constituants les ressources Web. Mal...

متن کامل

Analyse comparative de méthodologies et d'outils de construction automatique d'ontologies à partir de ressources textuelles

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Enrichissement sémantique de documents XML représentant des tableaux

Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiqu...

متن کامل

Peuplement automatique d'ontologie à partir d'un catalogue de produits

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1002.0239  شماره 

صفحات  -

تاریخ انتشار 2009